Figure lA 

Identity to SeqID No:l is indicated by a dot, and a dash ("-") indicates a missing 
nucleotide. 

* 20 * 40 * 

Seqidl : ATGAGATCTTCTTTCCGGTTGAAGCCGATTTGTTTTTATCTTATGGGTGT : 50 

Seqid3 : , : 50 

SeqidS : C : 50 



60 * 80 * 100 

Seqidl : TATGCTATATCATCATAGTTATGCCGAAGATGCAGGGCGCGCGGGCAGCG : 100 

Seqid3 : , " : 100 

SeqidS : . .0 .T : 100 



Seqidl 
Seqid3 
SeqidS 



* 120 * 140 * 

AGGCGCAGATACAGGTTTTGGAAGATGTGCACGTCAAGGCGAAGCGCGTA 



150 
150 
ISO 



160 * 180 * 200 

Seqidl : CCGAAAGACAAAAAAGTGTTTACCGATGCGCGTGCCGTATCGACCCGTCA : 2 00 

SeqidS : : 200 

SeqidS : : 200 



* 220 * 240 * 

Seqidl : GGATATATTCAAATCCAGCGAAAACCTCGACAACATCGTACGCAGCATCC : 250 

SeqidS : : 250 

SeqidS : • - • . ' 250 



260 * 280 * 300 
Seqidl : CCGGTGCGTTTACACAGCAAGATAAAAGCTCGGGCATTGTGTCTTTGAAT : 300 
SeqidS : : 3 00 
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* 320 * 340 * 
Seqidl : ATTCGCGGCGACAGCGGGTTCGGGCGGGTCAATACGATGGTGGACGGCAT : 350 

Seqid3 : • : 350 

SeqidS : : 350 

* 360 * 380 * 400 

Seqidl : CACGCAGACCTTTTATTCGACTTCTACCGATGCGGGCAGGGCAGGCGGTT : 400 

Seqid3 : : 400 

SeqidS : : 400 

* 420 * 440 * 
Seqidl : CATC TCAATTCGGTGCATCTGTC GAG AGCAATTTTATTGCCGGACTGGAT : 450 

Seqid3 : : 450 

SeqidS : : 450 

460 * 480 * 500 

Seqidl : GTCGTCAAAGGCAGCTTCAGCGGCTCGGCAGGCATCAACAGCCTTGCCGG : 500 

Seqid3 : : 500 

Seqid5 : - 500 

* 520 * 540 * 
Seqidl : TTCGGCGAATCTGCGGACTTTAGGCGTGGATGACGTCGTTCAGGGCAATA : 550 

Seqid3 : • 550 

Seqid5 : : 550 

560 * 580 * 600 

Seqidl : ATACCTACGGCCTGCTGCTAAAAGGTCTGACCGGCACCAATTCAACCAAA : 600 

Seqid3 : • 600 

Seqid5 : • 600 

* 620 * 640 * 
Seqidl :" GGTAATGCGATGGCGGCGATAGGTGCGCGCAAATGGCTGGAAAGCGGAGC : 650 



Figure IC 



Seqid3 : : 650 

SeqidS : - 650 

660 * 680 * 700 

Seqidl ; ATCTGTCGGTGTGCTTTACGGGCACAGCAGGCGCACGTGGGCGCAAAATT : 7 00 

Seqid3 : GCGT.... : 700 

SeqidS : GCGT : 700 

* 720 * 740 * 
Seqidl : ACCGCGTGGGCGGCGGCGGGCAGCACATCGGAAATTTTGGCGCGGAATAT : 7 50 

Seqid3 : : 750 

SeqidS : • 750 

760 * 780 * 800 

Seqidl : CTGGAACGGCGCAAACAGCGATATTTTGTACAAGAAGGCGGGTTGAAATT : 800 

SeqidS : G : 800 

SeqidS : T .G G..T.CT : 800 

* 820 * 840 * 
Seqidl : CAATTCCAACAGCGGAAAATGGGAGCGGGATTTCCAAAGGCCGTACTGGA : 850 

SeqidB : - 850 

SeqidS : G A. AAC.G.... : 850 

860 * 880 * 900 

Seqidl : AAACCAAGTGGTATCAAAAATACAATGACCCCCAAGAACTGCAAAAATAC : 900 

SeqidB : - : 900 

SeqidS : . .TA....CC....A....T CA.., A. : 897 

* 920 * 940 * 
Seqidl : ATCGAAGGTCATGACAAAAGCTGGCGGGAAAACCTGGCGCCGCAATACGA : 950 

Seqid3 : : 950 

SeqidS : : 947 
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960 * 980 * 1000 

Seqidl : CATCACCCCCATCGATCCGTCCAGCCTGAAGCAGCAGTCGGCAGGCAATC : 1000 

Seqid3 : : 1000 

SeqidS : : 997 

* 1020 * 1040 * 
Seqidl : TGTTTAAATTGGAATACGACGGCGTATTCAATAAATACACGGCGCAATTT : 1050 

Seqid3 : : 1050 

Seqid5 : : 1047 

1060 * 1080 * 1100 

Seqidl : CGCGATTTAAACACCAAAATCGGCAGCCGCAAAATCATCAACCGCAATTA : 1100 

Seqid3 : : HOO 

Seqid5 : : 1097 

* 1120 * 1140 * 
Seqidl : TCAATTCAATTACGGTTTATCTTTAAACTCATATGCCAACCTCAATCTGA : 1150 

Seqid3 : : 1150 

SeqidS : . . .G G G...C.G...A.. : 1147 

1160 * 1180 * 1200 

Seqidl : CCGCAGCCTACAATTCGGGCAGGCAGAAATATCCGAAAGGGTCGAAGTTT : 1200 

Seqid3 : - • • 12 00 

SeqidS : - 1197 

* 1220 * 1240 * 
Seqidl : ACAGGCTGGGGGCTTTTAAAAGATTTTGAAACCTACAACAACGCGAAAAT : 12 50 

Seqid3 : : 1250 

Seqid5 : G : 1247 

1260 * 1280 * 1300 

Seqidl : CCTCGACCTCAACAACACCGCCACCTTCCGGCTGCCCCGCGAAACCGAGT : 13 00 

Seqid3 : 1300 

SeqidS : : 1297 
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* 1320 * 1340 * 
Seqidl : TGCAAACCACTTTGGGCTTCAATTATTTCCACAACGAATACGGCAAAAAC : 1350 

Seqid3 : . : : 1350 

Seqid5 : : 1347 

1360 * 1380 * 1400 

Seqidl : CGCTTTCCTGAAGAATTGGGGCTGTTTTTCGACGGTCCGGATCAGGACAA : 1400 

Seqid3 : : 1400 

Seqid5 : . . T : 1397 

* 1420 * 1440 * 
Seqidl : CGGGCTTTATTCCTATTTGGGGCGGTTTAAGGGCGATAAAGGGCTGCTGC : 1450 

Seqid3 : : 1450 

Seqid5 : : 1447 

1460 * 1480 * 1500 

Seqidl : CCCAAAAATCAACCATCGTCCAACCGGCCGGCAGCCAATATTTCAACACG : 1500 

Seqid3 : : 1500 

SeqidS : T : 1497 

* 1520 * 1540 * 
Seqidl : TTCTACTTCGATGCCGCGCTCAAAAAAGACATTTACCGCTTAAACTACAG : 1550 

Seqid3 : - ..^ : 1550 

Seqid5 : : 1547 

1560 * 1580 * 1600 

Seqidl : CACCAATACCGTCGGCTACCGTTTCGGCGGCGAATATACGGGCTATTACG : 1600 

Seqid3 : : 1600 

Seqid5 : : -1597 

* 1620 * 1640 * 
Seqidl : GCTCGGATGACGAATTTAAGCGGGCATTCGGAGAAAACTCGCCGACATAC : 1650 
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Seqid3 : : 1650 

SeqidS : : 1647 

1660 * 1680 * 1700 

Seqidl : AAGAAACATTGCAACCAGAGCTGCGGAATTTATGAACCCGTATTGAAAAA : 17 00 

Seqid3 : : 1700 

SeqidS : G G : 1697 

* 1720 * 1740 * 
Seqidl : ATACGGCAAAAAGCGCGCCAACAACCATTCGGTCAGCATTAGTGCGGACT : 1750 

Seqid3 : : 1750 

Seqid5 : : 1747 

1760 * 1780 * 1800 

Seqidl : TCGGCGATTATTTCATGCCGTTCGCCAGCTATTCGCGCACACACCGTATG : 1800 

SeqidS : : 1800 

Seqid5 : : 17 97 

* 1820 * 1840 * 
Seqidl : CCCAACATCCAAGAAATGTATTTTTCCCAAATCGGCGACTCCGGCGTTCA : 1850 

SeqidS : • • ■ 18^0 

SeqidS : : 1847 

1860 * 1880 * 1900 

Seqidl : CACCGCCTTAAAACCAGAGCGCGCAAACACTTGGCAATTTGGCTTCAATA : 1900 

SeqidS : : 1900 

SeqidS : : 1897 

* 1920 * 1940 * 
Seqidl : CCTATAAAAAAGGATTGTTAAAACAAGATGATACATTAGGATTAAAACTG : 1950 

SeqidS : : 1950 

SeqidS : : 1947 



Figure IG 

I960 * 1980 * 2000 

Seqidl : GTCGGCTACCGCAGCCGCATCGACAACTACATCCACAACGTTTACGGGAA : 2 000 

Seqid3 : : 2000 

SeqidS : : 1997 

* 2020 * 2040 * 
Seqidl : ATGGTGGGATTTGAACGGGAATATTCCGAGCTGGGTCAGCAGCACCGGGC : 2 050 

Seqid3 : : 2050 

Seqid5 : G : 2047 

2060 * 2080 * 2100 

Seqidl : TTGCCTACACCATCCAACACCGCAATTTCAAAGACAAAGTACACAAACAC : 2100 

Seqid3 : : 2100 

Seqid5 : T G : 2097 

* 2120 * 2140 * 
Seqidl : GGTTTTGAGTTGGAGCTGAATTACGATTATGGGCGTTTTTTCACCAACCT : 2150 

Seqid3 : • 2150 

Seqid5 : : 2147 

2160 * 2180 * 2200 

Seqidl : TTCTTACGCCTATCAAAAAAGCACGCAACCGACCAACTTCAGCGATGCGA : 2200 

Seqid3 : - - ^ : 2200 

Seqid5 : : 2197 

* 2220 * 2240 * 
Seqidl : GCGAATCGCCCAACAATGCGTCCAAAGAAGACCAACTCAAACAAGGTTAT : 2250 

Seqid3 : : 2250 

Seqid5 : : 2247 



2260 * 2280 * 2300 
Seqidl : GGGTTGAGCAGGGTTTCCGCCCTGCCGCGAGATTACGGACGTTTGGAAGT : 2300 
Seqid3 : 2300 
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SeqidS : : 2297 

* 2320 * 2340 * 
Seqidl : CGGTACGCGCTGGTTGGGCAACAAACTGACTTTGGGCGGCGCGATGCGCT : 2350 

Seqid3 : : 2350 

SeqidS : : 2347 

2360 * 2380 * 2400 

Seqidl : ATTTCGGCAAGAGCATCCGCGCGACGGCTGAAGAACGCTATATCGACGGC : 2400 

Seqid3 : ■ • : 2400 

SeqidS : : 2397 

* 2420 * 2440 * 
Seqidl : ACCAACGGGGGAAATACCAGCAATGTCCGGCAACTGGGCAAGCGTTCCAT : 2450 

Seqid3 : : 2450 

SeqidS : T : 2447 

2460 * 2480 * 2500 

Seqidl : CAAACAAACCGAAACCCTTGCCCGCCAGCCTTTGATTTTTGATTTTTACG : 2500 

Seqid3 : : 2500 

SeqidS : T : 2497 

* 2520 * 2540 * 
Seqidl : CCGCTTACGAGCCGAAGAAAAACCTTATTTTCCGCGCCGAAGTCAAAAAT : 2550 

Seqid3 : : 2550 

SeqidS : : 2547 

2560 * 2580 * 2600 

Seqidl : CTGTTCGACAGGCGTTATATCGATCCGCTCGATGCGGGCAATGATGCGGC : 2600 

Seqid3 : : 2600 

SeqidS : ^ : 2597 
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* 2620 * 2640 * 
Seqidl : AACGCAGCGTTATTACAGTTCGTTCGACCCGAAAGACAAGGACGAAGAAG : 2 650 

Seqid3 : . : 2 650 

SeqidS : C C. : 2647 

2660 * 2680 * 2700 

Seqidl : TAACGTGTAATGCTGATAAAACGTTGTGCAACGGCAAATACGGCGGCACA : 2700 

Seqid3 : , : 2700 

SeqidS : : 2697 

* 2720 * 2740 * 
Seqidl : AGCAAAAGCGTATTGACCAATTTTGCACGCGGACGCACCTTTTTGATAAC : 2750 

Seqid3 : : 2750 

SeqidS : : 2747 

2760 

Seqidl : GATGAGCTACAAGTTTTAA : 27 69 

SeqidS : : 2769 

SeqidS : : 2766 
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Identity to SeqID No:2 is indicated by a dot, and a dash ("-") indicates a missing 
amino acid. 

* 20 * 40 * 
Seqid2 : MRSSFRLKPICFYLMGVMLYHHSYAEDAGRAGSEAQIQVIiEDVHVKAKRV : 50 

Seqid4 : - - - - : 50 

Seqid6 : T...Y : 50 

60 * 80 * 100 

Seqid2 : PKDKKVFTDARAVSTRQDIFKSSENLDNIVRSIPGAFTQQDKSSGIVSLN : 100 

Seqid4 : : : 100 

Seqid6 : : 100 

* 120 * 140 * 
Seqid2 : IRGDSGFGRVNTMVDGITQTFYSTSTDAGRAGGSSQFGASVDSNFIAGLD : 150 

Seqid4 : : 150 

Seqid6 : : 150 



160 * 180 * 200 

Seqid2 : WKGSFSGSAGINSLAGSANLRTLGVDDWQGNNTYGLLLKGLTGTNSTK : 2 00 

Seqid4 : : 200 

Seqid6 : • • : 200 



* 220 * 240 * 

Seqid2 : GNAMAAIGARKWLESGASVGVLYGHSRRTWAQNYRVGGGGQHIGNFGAEY : 2 50 

Seqid4 : SV : 250 

Seqid6 : SV : 250 
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260 * 280 * 300 

Seqid2 : LERRKQRYFVQEGGLKFNSNSGKWERDFQRPYWKTKWYQKYNDPQELQKY : 3 00 

Seqid4 : : 300 

SeqidG : A.... .D L . . QQ . . Y . P . KN . . N- : 299 



320 



340 



Seqid2 
Seqid4 
Seqid6 



lEGHDKSWRENLAPQYDITPIDPSSLKQQSAGNLFKLEYDGVFNKYTAQF : 350 

: 350 

: 349 



360 * 380 * 400 

Seqid2 : RDLNTKIGSRKIINRNYQFNYGLSLNSYANLNLTAAYNSGRQKYPKGSKF : 400 

Seqid4 : : 400 

Seqid6 : P.T : 399 



* 420 * 440 * 

Seqid2 : TGWGLLKDFETYNNAKILDLNNTATFRLPRETELQTTLGFNYFHNEYGKN : 450 

Seqid4 : : 450 

Seqid6 : : 449 



460 * 480 * 500 

Seqid2 : RFPEELGLFFDGPDQDNGLYSYLGRFKGDKGLLPQKSTIVQPAGSQYFNT : 500 

Seqid4 : : 500 

Seqid6 : : : 499 



Seqid2 
Seqid4 
Seqid6 



* 520 * 540 * 
FYFDAALKKDI YRLNYSTNTVGYRFGGEYTGYYGSDDEFKRAFGENS PTY : 550 
: 550 



549 
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560 * 580 * 600 

Seqid2 : KKHCNQSCGIYEPVLKKYGKKRANNHSVSISADFGDYFMPFASYSRTHRM : 600 

Seqid4 : : 600 

Seqid6 : R : 599 

* 620 * 640 * 
Seqid2 : PNIQEMYFSQIGDSGVHTALKPERANTWQFGFNTYKKGLLKQDDTLGLKL : 650 

Seqid4 : : 650 

Seqid6 : : 649 

660 * 680 * 700 

Seqid2 : VGYRSRIDl^IHNWGKWV^roLNGNIPSWSSTGLAYTIQHRNFKDKVHKH : 700 

Seqid4 : : 700 

Seqid6 : D : 699 

* 720 * 740 * 
Seqid2 : GFELELNYDYGRFFTNLSYAYQKSTQPTNFSDASESPNNASKEDQLKQGY : 750 

Seqid4 : : 7 50 

Seqid6 : ■ . . ■ : 749 

760 * 780 * 800 

Seqid2 : GLSRVSALPRDYGRLEVGTRWLGNKLTLGGAMRYFGKSIRATAEERYIDG : 800 

Seqid4 : : 800 

Seqid6 : : 799 

* 820 * 840 * 
Seqid2 : TNGGNTSIWRQLGKRSIKQTETLJUIQPLIFDFYAAYEPKKNLIFRAEVKN : 850 

Seqid4 : : 850 

Seqid6 : F . : 849 
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Seqid2 
Seqid4 
Seqid6 



860 * 880 * 900 

LFDRRYIDPLDAGNDAATQRYYSSFDPKDKDEEVTCNADKTLCNGKYGGT 



900 
900 
899 



Seqid2 
Seqid4 
Seqid6 



* 920 
SKSVLTNFARGRTFLITMSYKF 



922 
922 
921 
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Lanes : 1 : MW : 175, 83, 62, 47.5, 32,5, 25, 16.5, 6.5 

2 : Start 

3 : Flowthrough 

4 : 5 mM imidazole pool 

5 : BASB024 enriched pool 
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Lanes : 1 : MW : 175, 83, 62, 47.5, 32.5, 25, 16.5, 6.5 

2 : Start 

3 : Flowthrough 

4 : 5 mM imidazole pool 

5 : BASB024 enriched pool 
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